Unicode Matching কী? গাইড ও নোট

Web Development - জাভাস্ক্রিপ্ট রেগএক্সপি (Javascript RegExp) - Unicode এবং Unicode Property Escapes
258

Unicode Matching হল RegExp (Regular Expressions)-এ একটি শক্তিশালী বৈশিষ্ট্য যা স্ট্রিংয়ের মধ্যে ইউনিকোড চরিত্র (Unicode characters) খুঁজে বের করতে ব্যবহৃত হয়। ইউনিকোড হলো একটি আন্তর্জাতিক প্যাটার্ন যা বিশ্বের সব ভাষার অক্ষর ও প্রতীককে একটি সাধারণ ফরমেটে রূপান্তরিত করে। এতে রয়েছে প্রায় ১৫০টিরও বেশি ভাষার অক্ষর, প্রতীক, নম্বর, ইমোজি এবং অন্যান্য বিশেষ চিহ্ন।

RegExp ব্যবহার করে আপনি ইউনিকোড চরিত্রের সাথে মেলাতে পারবেন এবং এইচটিএমএল, জাভাস্ক্রিপ্ট অথবা অন্যান্য প্রযুক্তিতে ইউনিকোড স্ট্রিংয়ের মধ্যে অনুসন্ধান ও মান মিলানোর কাজ সহজে করতে পারবেন।


Unicode Matching এর পদ্ধতি

Unicode Matching সাধারণত ইউনিকোড প্যাটার্নের জন্য \u সিনট্যাক্স ব্যবহার করে করা হয়, যা পরে ৪টি হেক্সাডেসিমেল ডিজিট (\uXXXX) সহ একটি ইউনিকোড পয়েন্ট নির্দেশ করে।

Unicode Character এর Sintax

/\uXXXX/;

এখানে XXXX হলো একটি চার অঙ্কের হেক্সাডেসিমেল সংখ্যা, যা ইউনিকোড পয়েন্টকে চিহ্নিত করে।


Unicode Matching এর উদাহরণ

১. ইউনিকোড চরিত্রের খোঁজ

ধরা যাক, আমরা \u00A9 ইউনিকোড পয়েন্টের মাধ্যমে কপিরাইট সিম্বল (©) খুঁজে বের করতে চাই:

let regex = /\u00A9/;
let str = "This is the copyright symbol: ©";
console.log(regex.test(str));  // true

এখানে, \u00A9 প্যাটার্নটি কপিরাইট সিম্বল © এর জন্য ব্যবহৃত হয়েছে, এবং এটি স্ট্রিং "This is the copyright symbol: ©" এর মধ্যে মেলে।


২. একাধিক ইউনিকোড প্যাটার্ন খোঁজা

আপনি একাধিক ইউনিকোড প্যাটার্ন খুঁজতে [\uXXXX-\uYYYY] ব্যবহার করতে পারেন, যেখানে XXXX থেকে YYYY এর মধ্যে সব ইউনিকোড পয়েন্টের মিল হবে।

উদাহরণ:

let regex = /[\u0041-\u005A]/;  // A-Z এর জন্য
let str = "Hello World!";
console.log(regex.test(str));  // true

এখানে, [\u0041-\u005A] প্যাটার্নটি ইংরেজি বড় হাতের অক্ষর (A-Z) খুঁজে বের করবে, কারণ \u0041 হচ্ছে A এবং \u005A হচ্ছে Z।


৩. ইউনিকোড ব্লক বা সিম্বল খোঁজা

RegExp-এ Unicode property escapes (যেমন \p{...}) ব্যবহার করে আপনি বিশেষ ইউনিকোড সিম্বল বা ব্লক খুঁজতে পারেন। এটি JavaScript এর আধুনিক সংস্করণে (ES2018 এবং পরবর্তী) ব্যবহৃত হয়।

let regex = /\p{Script=Greek}/u;
let str = "Παράδειγμα";
console.log(regex.test(str));  // true

এখানে, \p{Script=Greek} ইউনিকোড স্ক্রিপ্ট "Greek"-এর সমস্ত অক্ষর খুঁজে বের করবে, এবং স্ট্রিং "Παράδειγμα" এর মধ্যে এই প্যাটার্ন মিলে যাবে।


Unicode Matching এর কিছু সাধারণ ব্যবহার

  1. ইমোজি খোঁজা: আপনি ইমোজি বা অন্যান্য বিশেষ চরিত্র খুঁজে বের করতে ইউনিকোড প্যাটার্ন ব্যবহার করতে পারেন। উদাহরণস্বরূপ, কিছু নির্দিষ্ট ইমোজি চরিত্র:

    let regex = /\uD83D[\uDC00-\uDCFF]/;  // Emoji range
    let str = "I love JavaScript! 💻";
    console.log(regex.test(str));  // true
    
  2. ভাষাগত অক্ষর: যদি আপনি বিশেষ ভাষার অক্ষর বা স্ক্রিপ্ট খুঁজতে চান, যেমন বাংলা, গ্রীক বা আরবি অক্ষর, তাহলে Unicode স্ক্রিপ্টের প্যাটার্ন ব্যবহার করে এটি করা সম্ভব:

    let regex = /\p{Script=Bangla}/u;
    let str = "বাংলা ভাষা";
    console.log(regex.test(str));  // true
    
  3. অন্যন্য ইউনিকোড সিম্বল: আপনি বিশেষ ইউনিকোড সিম্বল যেমন কপিরাইট, ট্রেডমার্ক বা অন্য কোনো নির্দিষ্ট প্রতীক খুঁজতেও Unicode Matching ব্যবহার করতে পারেন:

    let regex = /\u00AE/;  // ™ ট্রেডমার্ক সিম্বল
    let str = "This is a trademark symbol: ®";
    console.log(regex.test(str));  // true
    

সারাংশ

Unicode Matching RegExp এর মাধ্যমে আপনি স্ট্রিংয়ের মধ্যে ইউনিকোড চরিত্র বা সিম্বল খুঁজে বের করতে পারেন। এটি বিশেষভাবে কার্যকর যখন আপনি একাধিক ভাষার অক্ষর, ইমোজি, বা অন্যান্য বিশেষ চিহ্নের সাথে কাজ করছেন। \uXXXX সিনট্যাক্স ব্যবহার করে আপনি কোনো নির্দিষ্ট ইউনিকোড চরিত্র ম্যাচ করতে পারেন, এবং Unicode property escapes এর মাধ্যমে আপনি ইউনিকোড স্ক্রিপ্ট বা ব্লক খুঁজে বের করতে পারেন। এটি একটি শক্তিশালী টুল যখন আপনার স্ট্রিংয়ের মধ্যে ইউনিকোড বা বিশেষ চরিত্রগুলির জন্য অনুসন্ধান করতে হয়।

Content added By
Promotion

Are you sure to start over?

Loading...